روش پیش تعلیم لایه به لایه دوسویه برای تعلیم شبکه های عصبی عمیق

نویسندگان

سید علی سیدصالحی

دانشگاه صنعتی امیرکبیر، سیده زهره سیدصالحی

دانشگاه صنعتی امیرکبیر،

چکیده

در این مقاله، یک روش پیش تعلیم دوسویه برای همگرا نمودن تعلیم شبکه های عصبی عمیق با یادگیری دیگرانجمنی ارائه شده است. تعلیم این شبکه ها به دلیل مواجه بودن با تعداد بالای کمینه های موضعی اغلب همگرا نمی گردد. این در حالی است که با مقداردهی اولیه مناسب وزن های شبکه، می توان از بسیاری از کمینه های موضعی اجتناب نمود. روش پیش تعلیم لایه به لایه دوسویه روشی سریع و کارا می باشد که در یک مسیر دوسویه به طور جلوسو و عقب سو با استفاده از ورودی ها و خروجی های مطلوب شبکه، به تنظیم مقادیر اولیه وزن های آن می پردازد. برای این منظور از تعلیم شبکه های کمکی یک لایه پنهان مبتنی بر وزن های لایه تحت پیش تعلیم از شبکه عمیق و وزن های کمکی استفاده می شود. سپس مقادیر وزن حاصل از تعلیم اینها در ساختار اصلی شبکه تحت پیش تعلیم قرار داده می شوند و برای تنظیم دقیق وزن ها، تعلیم یکپارچه صورت می گیرد. این روش برای پیش تعلیم وزن های سه شبکه عصبی عمیق بازشناس فرد، حالت های احساسی و ارقام دستنوشتار مورد استفاده قرار گرفت و نشان داده شد که با به کارگیری این روش پیش تعلیم، سرعت همگرایی تعلیم به طور چشمگیری افزایش می یابد. همچنین میزان بازشناسی ها در پایگاه داده های چهره به میزان قابل توجهی بهبود می یابد که حاکی از افزایش قدرت تعمیم شبکه با استفاده از این روش می باشد.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

روش پیش‌تعلیم لایه‌به‌لایه دوسویه برای تعلیم شبکه‌های عصبی عمیق

در این مقاله، یک روش پیش‌تعلیم دوسویه برای همگرا نمودن تعلیم شبکه‌های عصبی عمیق با یادگیری دیگرانجمنی ارائه شده است. تعلیم این شبکه‌ها به‌دلیل مواجه بودن با تعداد بالای کمینه‌های موضعی اغلب همگرا نمی‌گردد. این در حالی است که با مقداردهی اولیه مناسب وزن‌های شبکه، می‌توان از بسیاری از کمینه‌های موضعی اجتناب نمود. روش پیش‌تعلیم لایه‌به‌لایه دوسویه روشی سریع و کارا می‌باشد که در یک مسیر دوسویه به‌ط...

متن کامل

روش پیش تعلیم سریع بر مبنای کمینه سازی خطا برای همگرائی یادگیری شبکه های عصبی با ساختار عمیق

در این مقاله با توسعه روش های موجود و بر مبنای کمینه سازی خطا و حفظ تمایز بیشینه مابین نمونه ها یک روش پیش تعلیم لایه به لایه سریع و کارا جهت مقداردهی اولیه مناسب وزن ها در شبکه های عصبی با ساختارهای عمیق ارائه شده است. تعلیم شبکه های عصبی عمیق به دلیل مواجه با تعداد بالای کمینه های موضعی اغلب همگرا نمی گردد. درحالیکه با مقداردهی اولیه مناسب وزن های شبکه به جای مقادیر تصادفی در ابتدای مسیر تعلی...

متن کامل

مهندسی شبکه های عصبی توسط اتوماتانهای یادگیر: تعیین اندازه مطلوب برای شبکه های عصبی سه لایه

هدف از مهندسی شبکه های عصبی بررسی معایب و مزایای شبکه های عصبی مصنوعی و ارایه روشهایی برای بهبود کارایی آنهاست. یکی از موضوعات مورد بحث در مهندسی شبکه های عصبی چند لایه، یافتن ساختار مناسب(نزدیک به بهینه) برای حل مسئله می باشد. معیار و نحوه انتخاب اندازه شبکه عصبی برای یک مسئله خاص هنوز شناخته شده نیست. در روشهای کلاسیک،طراح شبکه در ابتدای آموزش ساختاری را برای شبکه تعیین و سپس شبکه را آموزش می...

متن کامل

تخمین نتایج آزمایشSPT بااستفاده از روشهای احتمالاتی و شبکه عصبی در لایه های رسی( مطالعه موردی: لایه های رسی تبریز)

در این مطالعه تخمین نتایج آزمایش نفوذ استاندارد به روشهای احتمالاتی و نیز شبکه عصبی مصنوعی با استفاده از خصوصیات خمیری و فیزیکی لایه های رسی و با مطالعه موردی خاکهای رسی شهر تبریز انجام شده است. در این تحقیق دو گمانه ماشینی تحقیقاتی به عمق تا 8 متری حفاری شده و آزمون های آزمایشگاهی و صحرایی نفوذ استاندارد بر روی نمونه های تهیه شده انجام گرفت. با استفاده از نتایج آزمایشات و داده‌های موجود، بانک ...

متن کامل

مهندسی شبکه های عصبی توسط اتوماتانهای یادگیر: تعیین اندازه مطلوب برای شبکه های عصبی سه لایه

هدف از مهندسی شبکه های عصبی بررسی معایب و مزایای شبکه های عصبی مصنوعی و ارایه روشهایی برای بهبود کارایی آنهاست. یکی از موضوعات مورد بحث در مهندسی شبکه های عصبی چند لایه، یافتن ساختار مناسب(نزدیک به بهینه) برای حل مسئله می باشد. معیار و نحوه انتخاب اندازه شبکه عصبی برای یک مسئله خاص هنوز شناخته شده نیست. در روشهای کلاسیک،طراح شبکه در ابتدای آموزش ساختاری را برای شبکه تعیین و سپس شبکه را آموزش می...

متن کامل

پیش بینی رسانایی گرمایی نانوسیال گرافن با مدل شبکه عصبی مصنوعی چند لایه پرسپترون

هدف از این مطالعه مدلسازی و پیش بینی رسانایی گرمایی نانو سیال گرافن به کمک شبکه عصبی مصنوعی چند لایه پرسپترون است. پارامترهای دمای نانوسیال، کسرحجمی و رسانایی گرمایی نانو ذره به عنوان ورودی شبکه در نظر گرفته شده است. بااطلاعات مربوط به اندازه گیری‌های تجربی محققین قبلی در مورد رسانایی گرمایی نانوسیال گرافن در دمای 25 تا 50 درجه سلسیوس و در کسر حجمی  005/0 تا 056/0 تست عملکرد شبکه انجام شده است....

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
هوش محاسباتی در مهندسی برق

جلد ۶، شماره ۲، صفحات ۱-۱۰

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023